echo  "<unk>\n<s>\n</s>" > vocab.en
cat train.en | ./get_vocab.py | cut -f1 -d ' ' >> vocab.en
echo  "<unk>\n<s>\n</s>" > vocab.zh
cat train.zh | ./get_vocab.py | cut -f1 -d ' ' >> vocab.zh

